办案手记(9)可视化
可 视 化
信息和数据的可视化,作为数据分析系统的核心技术运用越来越受到重视,图形化直观展现可以清晰逻辑关系、便于有效沟通和理解分析,提高办案效率。
在接触和使用数岚情报分析专家系统以来,我们对这个软件中简洁直观、逻辑清晰的图形表格印象尤为深刻,因为确实对于我们的数据整理和分析判断起到了重要作用。我觉得信息和数据的可视化表达就应该这样,目的简单明确,与使用者的思路吻合,将已有数据堆积庞杂不易总结和发现的结果清晰呈现,便于分析判断,重在功能实用。
我和几位同事一起把办案分析对可视化的应用深入进行了学习和总结。
可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。常见的可视化图表包括曲线图、饼图、条形图、柱状图、散点图、气泡图、热力图、面积图、雷达图、仪表盘以及标注地图等。
数据可视化的呈现方法可以归纳为:
1、形意一体,将指标图形化;
2、统计数据,将指标值图形化;
3、构建场景,将指标关系图形化;
4、利用时间轴和地图,对时间和空间可视化;
5、替换类比,将数据进行概念转换;
6、交互联动,将图表动态化呈现。
结合对数岚系统的应用,我们来看看在账话单分析中为什么需要数据可视化?
我们先来看上图,一份普通的账单节选,一条银行流水记录往往有超过十多列数据,中文与阿拉伯数字并存,人员、时间、地点、金额、用途、流向等信息完备。
而一个案件少则数万条,多则上百万条账单,我们假设办案人员,一秒一条,从头到尾浏览一次银行流水。那么细致看完20万条账单的案件(这并不算多),需要不眠不休整整56小时,即使办案人员经验丰富、一目十行,仍需要整整6小时时间。
这种效率对于实际工作而言,是不可接受的,海量信息量变引起质变,超出人类认知负荷的工作必然会导致办案人员不自觉地排斥数据。
(消息太多了,往往就不看了)
于是,便需要数据的集成清洗,而数据可视化便是最常用的集成清洗方法之一。
一、宏观掌控
数据可视化是将数据集成为图像,而图像的方式展示有助于在宏观上了解数据的整体趋势。
比如账单的【交易色块】可以将一个人数年的交易记录集成在一张表上,每年根据月份和星期划分为365个点,当天交易总金额越多,则黄点越大。交易总金额最多的会高亮发光显示。【交易色块】可以以时间为线索,宏观掌控几年的交易情况,快速锁定可疑日期,找到有价值的线索。
比如话单的【一对一关系】非常直观地体现了一个人的作息、通话习惯,这有助于透过数据把握嫌疑人是个怎么样的人。
二、关系描述
数据可视化本质上是对数据关系的描述。当数据成为了图,数据的多寡就成了图的长度、曲度,数据的绝对大小因“比例尺”改变(如100万米在地图上仅为1厘米),但数据的相对大小却没有改变,相对大小、数据相关性构成了数据关系。
比如话单的【关系图】,以四个选中对象为中间点,仅展示四个人联系最多的对象,集中体现四个人的人际关系及共同联系人。
三、回归数据来源
有的数据来源本身就是图像式的(非字符、非数据),在记录、收集过程中转化为了数据,数据可视化有助于将这类数据还原为图像。
比如话单的【通话轨迹】,通话者的位置信息本身就是“图像式”的,即人在地球上的某个点打/接了一个电话,但数据却是以基站的代码记录。可以想象,假设按时间给出一长条的基站代码或对应的地址信息,这种数据实际上是没有太大价值的,人的认知并没有办法直接处理这类数据信息。而数据可视化则可以把基站和地址转化为地图上的一个点,结合时间先后绘制【通话轨迹】,将数据还原到最初的“图像式”。
四、从可视化再回到数据
数据可视化有上述举例的若干优点,但也有一个问题,可视化本身筛选提炼了数据,但同时也隐藏了数据,这时候图像和数据还需要做延伸的一一对应。
比如上文提到的【交易色块】,单击图中2016年6月3日的黄点,可以下钻查看具体4次交易分别是哪4条。数据可视化清洗优化了数据呈现,但想要的结果有时也会被随之省略。甚至有时不恰当的数据可视化,反而会成为分析的障碍,所以数据和图像的一一对应,就成了非常重要的事。
往期推荐
了解详情/业务咨询/申请试用,请联系我们,
服务热线:400-999-0905
关注公众号 成为办案高手
数岚情报分析专家